SOTA decentralized SGD algorithms can overcome the bandwidth bottleneck at the parameter server by using communication collectives like Ring All-Reduce for synchronization. While the parameter updates in distributed SGD may happen asynchronously there is still a synchronization barrier to make sure that the local training epoch at every learner is complete before the learners can advance to the next epoch. The delays in waiting for the slowest learners(stragglers) remain to be a problem in the synchronization steps of these state-of-the-art decentralized frameworks. In this paper, we propose the (de)centralized Non-blocking SGD (Non-blocking SGD) which can address the straggler problem in a heterogeneous environment. The main idea of Non-blocking SGD is to split the original batch into mini-batches, then accumulate the gradients and update the model based on finished mini-batches. The Non-blocking idea can be implemented using decentralized algorithms including Ring All-reduce, D-PSGD, and MATCHA to solve the straggler problem. Moreover, using gradient accumulation to update the model also guarantees convergence and avoids gradient staleness. Run-time analysis with random straggler delays and computational efficiency/throughput of devices is also presented to show the advantage of Non-blocking SGD. Experiments on a suite of datasets and deep learning networks validate the theoretical analyses and demonstrate that Non-blocking SGD speeds up the training and fastens the convergence. Compared with the state-of-the-art decentralized asynchronous algorithms like D-PSGD and MACHA, Non-blocking SGD takes up to 2x fewer time to reach the same training loss in a heterogeneous environment.
translated by 谷歌翻译
转移学习是一种深入学习技术,可以改善当人类通知标签昂贵且有限时学习的问题。代替此类标签,它使用先前训练的源模型的权重作为训练新目标数据集的基本模型的初始权重。我们演示了一种新颖但一般的技术,用于自动创建此类源模型。我们根据高尺寸的几何形状(Cayley-Menger-Menger的决定因素)基于经典结果的有效且可扩展的算法生成伪标记。这种G2L(``标签的几何图形'')方法通过使用HyperVolume含量的贪婪计算来逐步构建伪标记。我们证明了该方法相对于预期准确性是可调节的,可以通过源和目标之间的数据集相似性(差异)的信息理论度量来预测。 280个实验的结果表明,这种机械技术生成的基本模型与在广泛的人类注销的Imagenet1k标签上训练的模型的基线相比具有相似或更好的可传递性,从而产生了0.43 \%的总体误差降低,而4个误差降低了4%,4个误差降低。在5个发散数据集中测试。
translated by 谷歌翻译
API经济是指API(高级编程界面)微猎犬的广泛集成,软件应用程序可以相互通信,作为业务模型和功能的重要元素。可以使用这种系统的可能方式的数量是巨大的。因此,希望监视使用模式并识别系统以以前从未使用的方式使用。这为系统分析师提供了警告,并且可以确保系统不间断运行。在这项工作中,我们分析了API使用量的直方图和呼叫图,以确定系统的使用模式是否已移位。我们比较非参数统计和贝叶斯顺序分析对问题的应用。这是以一种克服重复统计测试问题的方式完成,并确保警报的统计显着性。该技术被模拟和测试,并证明有效地检测各种场景的漂移。我们还提到了对技术的修改来减少其存储器,以便在监控开始时发生在分布漂移时可以更快地响应。
translated by 谷歌翻译
训练有素的ML模型被部署在另一个“测试”数据集上,其中目标特征值(标签)未知。漂移是培训数据和部署数据之间的分配变化,这是关于模型性能是否改变的。例如,对于猫/狗图像分类器,部署过程中的漂移可能是兔子图像(新类)或具有变化特征(分布变化)的猫/狗图像。我们希望检测这些更改,但没有部署数据标签,无法衡量准确性。相反,我们通过非参数测试模型预测置信度变化的分布间接检测到漂移。这概括了我们的方法,并回避特定于域特异性特征表示。我们使用变更点模型(CPMS;参见Adams and Ross 2012)解决了重要的统计问题,尤其是在顺序测试中类型1误差控制。我们还使用非参数异常方法来显示用户可疑观察结果以进行模型诊断,因为更改置信度分布显着重叠。在证明鲁棒性的实验中,我们在MNIST数字类别的子集上进行训练,然后在各种设置中的部署数据中插入漂移(例如,看不见的数字类)(漂移比例的逐渐/突然变化)。引入了新的损耗函数,以比较不同水平的漂移类污染的漂移检测器的性能(检测延迟,1型和2个误差)。
translated by 谷歌翻译
科学出版物的产出成倍增长。因此,跟踪趋势和变化越来越具有挑战性。了解科学文档是下游任务的重要一步,例如知识图构建,文本挖掘和纪律分类。在这个研讨会中,我们从科学出版物的摘要中可以更好地理解关键字和键形酶提取。
translated by 谷歌翻译
本文介绍了基于织物的软气动执行器的设计和评估,其驱动需要低压要求,使其适用于婴儿的上肢辅助设备。目的是支持肩部绑架和内收,而无需禁止在其他平面上运动或阻塞肘关节运动。首先,通过模拟探索了具有内部空气电池的执行器设计家族的性能。执行器通过细胞数量及其宽度进行参数化。通过硬件实验进一步测试了通过模拟鉴定的物理可行的致动器变体。选择并根据婴儿的身体人为测量学的定制物理模型选择并测试两种设计。施加施加手臂的力,运动平滑度,路径长度和最大肩部角度的比较,请告知哪种设计更适合用作儿科可穿戴辅助设备的执行器,以及其他用于未来工作的见解。
translated by 谷歌翻译
这项工作着重于基于气动式柔软可穿戴设备的本体感受反馈的闭环控制,旨在将来支持婴儿完成任务。该设备包括两个柔软的气动执行器(一个基于纺织品和一个硅胶铸造),可积极控制每个手臂的两个自由度(分别为肩部内收/绑架和肘部屈曲/扩展)。可穿戴设备附加的惯性测量单元(IMU)提供实时关节角度反馈。通过文献中报道的婴儿(ARM长度)的人体测量数据来告知设备运动学分析。婴儿到达中的运动和肌肉共同激活模式被认为是为设备的最终效应器提供所需的轨迹。然后,开发了一个比例衍生的控制器来调节执行器内部的压力,然后沿着可及工作空间内的所需设定点移动手臂。提出了有关使用工程模特的跟踪所需的臂轨迹的实验结果,表明所提出的控制器可以帮助指导人体模特的腕部到达所需的设定点。
translated by 谷歌翻译
人工智能,当与游戏进行合并时,使研究和推进领域的理想结构。多种代理游戏对每个代理具有多个控件,同时增加搜索复杂性的同时生成大量数据。因此,我们需要高级搜索方法来查找解决方案并创建人工智能代理。在本文中,我们提出了我们的小说进化蒙特卡罗树搜索(FEMCTS)代理商,借用从进化的Algorthims(EA)和Monte Carlo树搜索(MCT)的想法来玩Pommerman的比赛。它优于滚动地平线进化算法(Rhea)在高可观察性环境中显着,几乎和MCTS用于大多数游戏种子,在某些情况下表现优于它。
translated by 谷歌翻译
本文的目标是两倍。第一个目标是作为深度学习模型的工作的陈述教程,这强调了关于深度学习成功原因的几何直觉。第二个目标是补充当前的结果对深度学习模型的表现力及其具有新颖洞察力和结果的损失。特别是,我们描述了深度神经网络如何雕刻歧管,尤其是当乘法神经元引入倍增神经元时。乘法用于点产品和注意机制,它采用胶囊网络和基于自我关注的变压器。我们还描述了如何对损耗表面上的随机多项式,随机矩阵,旋转玻璃和计算复杂性观点是互连的。
translated by 谷歌翻译